home *** CD-ROM | disk | FTP | other *** search
/ HamCall (October 1991) / HamCall (Whitehall Publishing)(1991).bin / bcast / audvid / dolbys.txt < prev    next >
Text File  |  1990-10-14  |  25KB  |  461 lines

  1. Spectral Recording Process
  2. Technical Aspects
  3.  
  4. Dolby Laboratories, Inc.
  5. San Francisco and London
  6. 386-6825
  7.  
  8. By Ray M. Dolby
  9. February 24, 1986
  10.  
  11. Brief Outline
  12. -------------
  13.  
  14.   The spectral recording process includes some layout and operating 
  15. characteristics in common with those of the A-type, B-type, and C-type 
  16. noise reduction systems. Regarding general principles, reference should 
  17. be made to the technical papers on these systems; the C-type paper is 
  18. particularly relevant.
  19.  
  20.   Relevant to the figure called "Basic Block Diagram - Spectral 
  21. Recording Encoder and Decoder", a main signal path is primarily 
  22. responsible for conveying high level signals. The side chain signals are 
  23. additively combined with the main signal in the encoding mode and 
  24. subtractively in the decoding mode, whereby an overly complementary 
  25. action is obtained. In this diagram a dedicated encoder and decoder are 
  26. shown laid out in a symmetrical fashion; other decoder configurations 
  27. are possible in switchable circuits.
  28.  
  29.   The SR stage layout resembles that of the C-type system, except that 
  30. three levels of action staggering are used: high-level, mid-level, and 
  31. low-level. There are various advantages arising from the use of multi-
  32. level stages, including action compounding for good spectral 
  33. discrimination, accuracy and reproducibility, low distortion, and low 
  34. overshoot. The thresholds used are about -30dB, -48dB, and -62dB below 
  35. reference level (20dB below SR peak signal level). For the high-level 
  36. and mid-level stages both high frequency and low frequency circuits are 
  37. used, with a crossover of 800 Hz. The low-level stage is high frequency 
  38. only, with an 800 Hz high pass characteristic. There is a significant 
  39. overlap region between the high and low frequency stages, the high 
  40. frequency stages extending their effects up to about 3 kHz. This overlap 
  41. contributes to the spectral tracking abilities of the system.
  42.  
  43.   Each stage above has a low-level gain of 8dB, whereby a total dynamic 
  44. effect of 16dB is obtained at low frequencies and 24dB is obtained at 
  45. high frequencies. A further dynamic action of about 1-2dB takes place 
  46. above the reference level.
  47.  
  48.   The spectral skewing network has the same purpose and function as in 
  49. the C-type system, except that a spectral skewing action is provided at 
  50. low frequencies as well. The high frequency network is a low pass filter 
  51. with an attenuation characteristic similar to that of a 12kHz two-pole 
  52. Butterworth filter. The low frequency network is a 40 Hz high pass 
  53. filter, connected in series with the high-frequency network, also with a  
  54. two-pole Butterworth-like characteristic. The spectral skewing networks 
  55. de-sensitize the stage circuits to the influence of signal components at 
  56. the extreme ends of the audio frequency band. This effect is 
  57. particularly helpful if the tape recorder has an uncertain frequency 
  58. response in these regions. The filters are of course also important in 
  59. attenuating subsonic and supersonic interferences of all kinds. The 
  60. spectral skewing action is compensated in the decoder, resulting in an 
  61. overall flat response.
  62.  
  63.   Both high frequency and low frequency antisaturation networks are 
  64. provided in the main signal path. The networks are operative above about 
  65. 4 kHz and below about 100 Hz. There is an effective compounding of the 
  66. antisaturation effects produced by the antisaturation networks and the 
  67. spectral skewing networks. The overall result is an antisaturation 
  68. effect of 2-3 dB at 5 kHz, 6 dB at 10 kHz and 10 dB at 25 Hz and 15 kHz.
  69.  
  70. Least Treatment Principle
  71. -------------------------
  72.  
  73.   A design philosophy used in the development of the new system is that 
  74. the best treatment of the signal is the least treatment. The design goal 
  75. for the encoder is to provide a predetermined, fixed gain for all sub-
  76. threshold signal components. If a large signal component appears at a 
  77. particular frequency or frequencies, then the gain should be reduced at 
  78. those frequencies only in accordance with a predetermined compression 
  79. law so that it is possible to restore the signal during decoding. In 
  80. other words, the compressor tries to keep all low level signal 
  81. components fully boosted at all times; when the boosting must be cut 
  82. back at a particular frequency the effect should not be extended to low-
  83. level signal components at other frequencies.
  84.  
  85.   The audible effect of this type of compression is that the signal 
  86. appears to be enhanced and brighter but without any apparent dynamic 
  87. compression effects (the ear detects dynamic action primarily by the 
  88. effect of a gain change due to a signal component at one frequency on a 
  89. signal component at some other frequency). If the ear cannot detect 
  90. dynamic effects in the compressed signal then a) it is unlikely that 
  91. noise modulation effects will be evident in the decoded signal, and b) 
  92. it is unlikely that signal modulation effects will be evident in the 
  93. decoded signal if there should be a gain or frequency response error in 
  94. the recording or transmission channel.
  95.  
  96.   In the spectral recording process two new methods are used that 
  97. greatly reduce the circuitry required to achieve the design goal of a 
  98. full spectrally responsive system. In particular, both fixed and sliding 
  99. bands are used in a  unique combination, called action substitution, 
  100. that draws on the best features of both types of circuits. A further 
  101. technique, called modulation control, greatly improves the performance 
  102. of both fixed and sliding bands in resisting any modulation of signal 
  103. components unless necessary.
  104.  
  105.   The use of the new methods reduces the basic encoder to two frequency 
  106. bands only (high frequency and low frequency), each with a fixed band 
  107. and a sliding band. When the three-level action staggering layout is 
  108. taken into account, five fixed bands and five sliding bands are 
  109. employed.
  110.  
  111. Action Substitution
  112. -------------------
  113.  
  114.   Both fixed band and sliding band dynamic actions are used in each of 
  115. the five stages. In any particular stage, fixed band operation is used 
  116. whenever it provides best performance; sliding band operation is 
  117. substituted whenever it has an advantage. In this way the best features 
  118. of both methods are obtained, without the attendant disadvantages of 
  119. each.
  120.  
  121.   The substitution is effective on a continuous and frequency by 
  122. frequency basis. For example, the output from a given high frequency 
  123. stage will typically be from the fixed band for frequencies up to the 
  124. dominant signal component and from the sliding band above that 
  125. frequency.
  126.  
  127.   The advantages of fixed band circuits arise from the fact that all 
  128. signal frequencies within the band are treated equally, in contrast with 
  129. sliding band action. Thus the appearance of a signal component actuating 
  130. the compressor results in a loss of noise reduction effect that 
  131. manifests itself in a uniform manner throughout the band; the loss is 
  132. not concentrated in any particular frequency region, as in sliding band 
  133. circuits.
  134.  
  135.   In contrast, the advantages of sliding band compression and expansion 
  136. circuits derive from the fact that all signal frequencies are not 
  137. treated equally. In particular, compression, expansion, and noise 
  138. reduction action are well maintained above the frequency of the dominant 
  139. signal component in high frequency circuits, and below the frequency of 
  140. the dominant signal component in low frequency circuits; this action 
  141. maintenance effect, except on a one to one basis, is absent in fixed 
  142. band circuits.
  143.  
  144.   The action substitution technique provides the advantages of fixed and 
  145. sliding band circuits while avoiding their disadvantages. In other 
  146. words, there is a significantly improved adherence to the ideal of least 
  147. signal treatment; the signal more closely approaches fully boosted 
  148. conditions in the encoding mode, with a consequently improved noise 
  149. reduction effect in the decoding mode.
  150.  
  151. Modulation Control
  152. ------------------
  153.  
  154.   In the A-type, B-type, and C-type systems the signal from the side 
  155. chain is highly limited under high-level signal conditions. This high 
  156. degree of limiting, beginning at a low-level threshold, is responsible 
  157. for the low distortion, low overshoot, and low modulation distortion 
  158. which characterize these systems.
  159.  
  160.   A closer examination shows that it is unnecessary to utilize such a 
  161. low threshold and such a strong limiting characteristic under certain 
  162. signal conditions. In particular, whenever the side chain signal departs 
  163. from an in-phase condition with respect to the main path signal, then 
  164. the threshold can be raised. Furthermore, after an appropriate degree of 
  165. limiting has taken place at a given frequency (in order to create the 
  166. desired overall compression law), then it is unnecessary to continue the 
  167. limiting as the signal level rises. Rather the level of the side chain 
  168. signal can be allowed to rise as the input signal rises, stabilizing at 
  169. some significant fraction of the main path signal level.
  170.  
  171.   In the fixed band portions of the circuit the above arrangement 
  172. results in conventional performance in the pass-band (in-phase) 
  173. frequency region. However, in the stop-band region the modulation 
  174. control arrangement causes the limiting threshold to rise and the degree 
  175. of limiting to be reduced. In this way large signals in the stop-band do 
  176. not cause signal modulation in the pass-band and consequently an 
  177. impairment of the noise reduction effect achieved during decoding.
  178.  
  179.   Similar considerations apply in the SR sliding band circuits. Above 
  180. the threshold at a particular frequency the variable filter slides to 
  181. the turnover frequency needed to create the overall (main path plus side 
  182. chain signal) compression law. As the input level rises, and once an 
  183. overall gain of unity is obtained, there is no reason for further 
  184. sliding of the variable filter. At this point the modulation control 
  185. arrangement counteracts further sliding of the variable filter; as with 
  186. the fixed band circuits, this prevents unnecessary modulation of the 
  187. signal with consequent impairment of the noise reduction effect.
  188.  
  189.   The modulation control aspects of the SR process result in a 
  190. compression action which is remarkably free of noticeable signal related 
  191. modulation effects. Working together with action substitution, 
  192. modulation control contributes to the goal of least treatment, in 
  193. providing a highly boosted, audibly stable signal.
  194.  
  195. Overshoot Suppression
  196. ---------------------
  197.  
  198.   A highly flexible overshoot suppression system is used; a multiplicity 
  199. of overshoot suppression circuits operate directly upon the control 
  200. signals of the various stages. The SR process employs overshoot 
  201. suppression thresholds that are significantly higher than the steady 
  202. state thresholds; the low level overshoot suppression levels are set at 
  203. about 10 dB above the relevant steady state thresholds. The overshoot 
  204. suppression effects are then phased in gradually as a function of 
  205. increasing impulse level. The net result is that for most musical 
  206. signals the overshoot suppressers rarely operate; the compressors are 
  207. controlled by well smoothed, double integrated dc control signals. When 
  208. the suppressers do operate, the effect is so controlled that modulation 
  209. distortion is minimal. Under relatively steady state, but nonetheless 
  210. changing, signal conditions the overshoot suppression effects are 
  211. gradually phased out with increasing signal levels; this action further 
  212. ensures low overall modulation distortion from the system. The 
  213. thresholds are controlled by the same modulation control circuits used 
  214. to control the steady state characteristics; thus there is a tracking 
  215. action between the transient and steady state behavior.
  216.  
  217.   In the low frequency circuits special overshoot suppressers are used 
  218. for relatively slowly changing low frequency signals; these are very 
  219. gentle, slow acting circuits which reduce low frequency transient 
  220. distortion.
  221.  
  222. Operating Characteristics
  223. -------------------------
  224.  
  225.   Quiescent (sub-threshold) noise reduction effect:
  226.   ------------------------------------------------
  227.  
  228.   The spectral recording process has been designed in a way that takes 
  229. advantage of the characteristics of hearing and of existing recording 
  230. processes. There is less of a problem in the generation and perception 
  231. of noises at moderately low frequencies (e.g. 200 Hz) than at moderately 
  232. high frequencies (e.g. 3 kHz); therefore two low frequency stages are 
  233. employed, but three high frequency stages are used. A noise reduction 
  234. effect of about 16 dB is obtained at low frequencies; at high 
  235. frequencies the effect is about 24 dB.
  236.  
  237.   At very low and very high frequencies less noise reduction is needed 
  238. (below 50 Hz and above 10 kHz). Strong spectral skewing actions can 
  239. therefore be used in these regions, resulting in high and low frequency 
  240. sliding band actions which are more accurate in the event that the tape 
  241. recorder has response irregularities in these regions. Additionally, the 
  242. spectral skewing networks provide for good immunity to high and low 
  243. frequency interference (supersonic audio components, tape recorder bias; 
  244. subsonic noise components, particularly room rumble from traffic and air 
  245. conditioning).
  246.  
  247.   The overall shape of the low-level noise reduction characteristic 
  248. resembles the inverse of the low level Fletcher-Munson and Robinson-
  249. Dadson curves, as well as the consequently derived CCIR noise weighting 
  250. curve.
  251.  
  252.   The amount of noise reduction provided by the spectral recording 
  253. process is enough to yield an overall usable dynamic range with 15 ips 
  254. tape that comfortably equals or exceeds that of 16 bit PCM. For example, 
  255. if signal gains are adjusted such that the audible noise levels of the 
  256. two recording processes are similar, at high levels SR will typically 
  257. have several dB of further soft clipping headroom available. At very low 
  258. signal levels, with increased monitor gain, the audible signal quality 
  259. of SR will be superior because of its inherently linear analogue 
  260. transfer characteristic.
  261.  
  262.      Dynamic action for steady-state dominant signals:
  263.      ------------------------------------------------
  264.  
  265.   Low Frequencies:   dynamic action occurs in the range -48 dB to -5 dB 
  266. (with respect to reference level); i.e. there is no action in the lower 
  267. 35-40 dB of the total dynamic range (starting from the system noise 
  268. level) but full boosting or attenuation, or the top 25 dB of the total 
  269. dynamic range (ending with the clipping level): there is a linear 
  270. dynamic characteristic in these two regions.
  271.  
  272.   High Frequencies:  dynamic action occurs in the range -62 dB to -5 dB 
  273. (with respect to reference level); i.e. there is no action in the lower 
  274. 20-25 dB boosting or attenuation, or the top 25 dB of the total dynamic 
  275. range (ending with the clipping level): there is a linear dynamic 
  276. characteristic in these two regions.
  277.  
  278.   In the dynamic action ranges the effects of the multi-level stages are 
  279. joined together to create a compression ration of about 2:1.
  280.  
  281.   Dynamic action for steady-state non-dominant signal components:
  282.   --------------------------------------------------------------
  283.  
  284.   Non-dominant signals are boosted or attenuated over and above that of 
  285. the dominant signal towards the two spectrum ends by high and low 
  286. frequency sliding band actions. If there are two dominant signals, a 
  287. fixed band compression or expansion effect prevails for the non-dominant 
  288. signal components (therefore no mid-band modulation effect).
  289.  
  290.   Thus, non-dominant signal components are boosted or attenuated by an 
  291. amount at least equal to that of the dominant signal. The boosting or 
  292. attenuation of the non-dominant signals is maintained towards the 
  293. spectrum ends even though the level of the dominant is relatively high 
  294. (e.g. in the range -10 dB to +20 dB, with respect to reference level). 
  295. This boosting or attenuation action spectrally tracks the dominant 
  296. signal frequency or frequencies.
  297.  
  298.   To provide a steep boosting or attenuation effect away from the 
  299. frequency of the dominant signal component, the SR circuit employs the 
  300. steepness enhancing effect that arises from the use of cascaded stages. 
  301. The low frequencies have two stages of steepness compounding. At high 
  302. frequencies the use of three stages improves the effect even further.
  303.  
  304.   The overall result is that the encoder circuit tends toward keeping 
  305. all low level signal components boosted at all times. Only those 
  306. components above the threshold are subject to a reduction of boosting. 
  307.  
  308.   The advantages of this type of characteristic are:
  309.  
  310.   a) A powerful noise reduction effect in the presence of signals, much 
  311. more so than with any previous system. This property is responsible for 
  312. the high purity of signals from the SR system.
  313.  
  314.   b) Freedom from the mid-band modulation effect. The system is 
  315. essentially immune to exaggerated frequency response errors due to 
  316. frequency response problems in the recorder, including 30 ips head-bump 
  317. signal-pumping effects.
  318.  
  319.   The audible encoding effect of the system is to create a dense, bright 
  320. sounding signal, but with little or no apparent dynamic action. 
  321. harmonics, overtones, and small scale components of the sound, including 
  322. noise, are all enhanced.
  323.  
  324.   The decoding effect of the system, in response to an encoded signal, 
  325. is to provide a wholly restored signal with respect to frequency and 
  326. phase response, including all transient effects. Regarding noises 
  327. introduced into the encoded signal, the decoding property of the system 
  328. is to create a very clean sounding replica of the input. The decoder 
  329. reduces the tape bias noise and modulation noise, spectrally and 
  330. temporally, in a way that previous systems have not been able to do. 
  331. Moreover, the low frequency noise reduction effect of the system is 
  332. quite useful in dealing with high frequency intermodulation components. 
  333. For example, if two or more simultaneous high frequency tones are 
  334. applied, at a level high enough to create audible intermodulation 
  335. distortion, the system will significantly reduce the lower frequency 
  336. distortion components produced.
  337.  
  338.   The decoder is also useful in reducing harmonic distortion produced by 
  339. the recording medium. Steady-state third harmonic distortion is 
  340. typically reduced to less than one-half; fifth harmonic distortion is 
  341. reduced to less than one-quarter. Higher order harmonics are even 
  342. further reduced. Thus, especially if the medium has a hard clipping 
  343. characteristic, the audible cleanliness of the signal at high recording 
  344. levels is significantly improved.
  345.  
  346.   Antisaturation aspects
  347.   ----------------------
  348.  
  349.   The antisaturation effects of SR are maintained down to fairly low 
  350. levels (about 15 dB below reference level). The result is to produce 
  351. recordings that are notably freer of intermodulation distortion than 
  352. would otherwise be the case. This is particularly true in live recording 
  353. situations, in which significant signal components may exist.
  354.  
  355.   At low frequencies the LF antisaturation characteristic has a double 
  356. significance. First, low frequency signal components are reduced in 
  357. amplitude on the recording, thereby permitting higher signal levels at 
  358. higher frequencies (in optical recording, the spaces used on the sound 
  359. track add directly, in contrast with magnetic recording, which, to some 
  360. extent allows the high frequencies to be superimposed on the low 
  361. frequency components). Second, the antisaturation characteristic carries 
  362. on strongly down to very low frequencies (40 Hz, 20 Hz). This allows the 
  363. recording and reproduction of low frequency special effects with ease 
  364. (10 dB of antisaturation at 25 Hz).
  365.  
  366.   The existence of the new system will no doubt prompt a re-evaluation 
  367. of recording and transmission formats which have been thought to be 
  368. inadequate or marginal for professional use. In radio broadcasting, for 
  369. example, the new system might result in greater use of 7 1/5 ips and 
  370. various cassette and cartridge formats. Conventional landlines will also 
  371. be worthy of investigation; the new system is substantially more 
  372. effective than previous ones in dealing with landline types of noises 
  373. (whistles, hums, buzzes, crosstalk).
  374.  
  375.   Calibration Arrangements 
  376.   ------------------------
  377.  
  378.   The spectral recording calibration procedures and circuits are 
  379. conceptually similar to those of the A-type noise reduction system. That 
  380. is, signal levels in the decoder circuit ideally should match those in 
  381. the encoder circuit (however, the SR system is more tolerant of gain and 
  382. frequency response errors than A-type). For tape interchange 
  383. standardization it is also preferable if, at least within a given 
  384. organization, the "Dolby Level" of the encoder and decoder corresponds 
  385. to a known and fixed flux level. Whether or not a standardized flux is 
  386. used for Dolby Level, the matching of the decoder to the encoder is 
  387. accomplished by a calibration signal generated in the encoder and 
  388. recorded on the tape; this allows the tape replay gain to be set 
  389. correctly, using the meter in the decoder unit.
  390.  
  391.   Most problems in the studio use of A-type noise reduction, and indeed 
  392. analogue recording in general, can be traced to incorrect level settings 
  393. and/or frequency response errors in the recorder. This may be because 
  394. checking these factors is a time consuming and boring process. A faster 
  395. and more interesting method of accomplishing these checks would be more 
  396. likely to produce reliable and consistent results.
  397.  
  398.   Commercial embodiments of the SR process include a pink noise 
  399. generator which is used for both level and frequency response 
  400. calibration, instead of a single-tone sine wave oscillator. For 
  401. identification, the pink noise is interrupted with 20 ms "nicks" every 2 
  402. seconds; the resulting signal is called "Dolby Noise". During recording 
  403. this signal is fed to the tape at a level of 15 dB below reference level 
  404. (Dolby Level), a level low enough not to cause saturation problems with 
  405. low speed tape recording or highly equalized transmission channels.
  406.  
  407.   During playback the tape signal is automatically alternated with 
  408. internally generated reference pink noise (uninterrupted) in 4 second 
  409. segments (8 second total cycle time) and passed to the monitor output. 
  410. An audible comparison can thus be made between the reference pink 
  411. noise and the Dolby Noise coming from the tape. This mode of operation 
  412. is called "Auto Compare". Any discrepancies in level and/or spectral 
  413. balance are immediately noticeable and can be corrected or at least 
  414. taken note of. If desired, the signal can also be fed to a real time 
  415. analyzer. The 20 ms nicks in the signal do not affect the analyzer 
  416. display because of the peak hold circuits employed in the analyzer.
  417.  
  418.   In using the new calibration method it is important to be able to tell 
  419. when the 4 second tape segments are being passed to the monitor and when 
  420. the signal heard is from the reference pink noise generator. 
  421. Differentiation of the tape segments are 4 seconds of continuous pink 
  422. noise, and the tape segments begin with a nick in the middle, and end 
  423. with a nick; this time sequence is easily identified with a little 
  424. practice. Second, lights on the SR module identify the signals. A green 
  425. light marks the tape signal, a red light the reference signal. An output 
  426. is available for actuating externally mounted lights, such as near the 
  427. loudspeakers.
  428.  
  429.   A further yellow light on the module shows that the module is in the 
  430. Dolby Noise mode, which is actuated by pressing the "Dolby Tone" button 
  431. on the frame.
  432.  
  433.   During calibration the meter circuit in the frame is fed by a band 
  434. limited (200 Hz - 4 kHz) Auto Compare signal from the module. Band 
  435. limiting reduces the effect on the meter reading of frequency response 
  436. errors in the tape recorder and also improves the stability of the 
  437. reading (less bouncing).
  438.  
  439.   The calibration facility built into the new system will give the 
  440. recording engineer and producer a control and monitoring of the 
  441. recording process that was previously unavailable. At any time an Auto 
  442. Compare check of the recorder can be made. The result can be heard 
  443. immediately and conclusions drawn about whether any recorder adjustments 
  444. might be necessary.
  445.  
  446.   With tape and signal interchanges it will be possible to tell quickly 
  447. whether there is any error or misunderstanding about levels, 
  448. equalization, azimuth and the like. If the original recording of the 
  449. Dolby Noise stays with the tape, quality of the ultimate playback, even 
  450. after copying, will be retained. Thus the Auto Compare function serves 
  451. to ensure that the recorder and spectral recording process will provide 
  452. on a routine basis the high signal quality and reliability of which they 
  453. are capable.
  454.  
  455. Conclusion 
  456. ----------
  457.  
  458.   Brief details of the new spectral recording process have been given. A 
  459. full technical account of the system was presented at the Fall 1986 AES 
  460. Convention in Los Angeles.   Reprints are available from the AES.